Data Science 2
Saskia Otto
Universität Hamburg, IMF
Sommersemester 2023
| VL | Datum | Thema |
|---|---|---|
| 1 | 06.04.2023 | Einführung in das exp. Design & die mathematische Statistik |
| 2 | 13.04.2023 | Wahrscheinlichkeitstheorie |
| 3 | 20.04.2023 | Wahrscheinlichkeitsverteilungen |
| 4 | 27.04.2023 | Schätzverfahren |
| 5 | 04.05.2023 | Hypothesentests |
| 6 | 06.05.2023 | Klassische Tests - Teil 1 |
| 7 | 11.05.2023 | Klassische Tests - Teil 2 |
| 8 | 25.05.2023 | Einfache Varianzanalyse (ANOVA) |
| 9 | 01.06.2023 | Korrelation, Transformation |
| 10 | 15.06.2023 | Regression |
| 11 | 22.06.2023 | Poweranalyse und Bestimmung des Stichprobenumfangs |
| 11 | 29.07.2023 | Grundlagen des exp. Designs - Teil 1 |
| 12 | 6.07.2023 | Grundlagen des exp. Designs - Teil 2 |
Hauptphasen der Durchführung wissenschaftlicher Studien
“…I discovered that more than a decade of teaching statistics and experimental design to ecology students had largely been wasted. Students came to me toward the end of their master’s or Ph.D. courses with masses of data that were largely irrelevant to their questions. Some of these students had done my statistics course, some had received courses from professional statisticians in southern Brazil, and some had master’s or bachelor’s degrees from prestigious U.S., British, or French universities.” | William E. Magnusson
→ Dies kann nur durch eine sorgfältige Planung vorweg erreicht werden, nicht NACHDEM die Daten erhoben wurden.
Eines von NOAAs fischereiwissenschaftlichen Laboren zur Untersuchung der Effekte der Ozeanversauerung auf marine Organismen.
MEDIMEER (MEDIterranean platform for Marine Ecosystem Experimental Research) Experiment im Frühjahr 2018 in Sète, Frankreich.
Emutlu et al. (2012): 18O-assisted dynamic metabolomics
for individualized diagnostics and treatment of human
diseases, Croat Med J 53(6): 529–534
Die Statistik ist ein Teilgebiet der reinen Mathematik und betrachtet das Sammeln, die Analyse, die Präsentation und Interpretation von Daten. Sie stellt somit die theoretische Grundlage aller empirischen Forschung dar.
.. gaben vor allem Glücksspiele Anfang des 17. Jhd.
Bildquelle Roulettespieler: Wikipedia (CC0 Lizenz)
Um 1615 sollen italienische Spieler (in einigen Quellen heißt es auch der Fürst von Toskana) Galilei folgende Frage gestellt haben, welche eine viel diskutierte, Jahrhunderte alte Aufgabe darstellte:
Wie groß sind die Wahrscheinlichkeiten, mit 3 Würfeln eine Summe von 9 oder 10 zu erhalten?
Die damaligen Theoretiker behaupteten, dass beide Summen gleich wahrscheinlich seien. Aus ihrer Erfahrung wussten allerdings die Glücksspieler, dass die 10 häufiger als die 9 autritt.
Als eigentliche Geburtsstunde der mathematischen Wahrscheinlichkeitsrechnung gilt das Jahr 1654. Chevalier de Meré, ein Philosoph und Literat am Hofe Ludwigs des XIV, wandte sich mit folgendem Problemen an den bekannten Mathematiker Blaise Pascal:
Was ist wahrscheinlicher, in vier Würfen eines einzelnen Würfels mindestens eine ‘6’ zu würfeln ODER in 24 Würfen eines Würfelpaars mindestens eine ‘Doppelsechs’ zu erzielen?{.bg-code}
Auch dieses Probleme war damals schon viele Jahrhunderte alt. Allerdings waren die früheren Lösungen falsch.
Bildquelle zur Geschichte der Statistik: Magnello & van Loon (2013)
Bildquelle zur Geschichte der Statistik: Magnello & van Loon (2013)
Youtube Link zum Interview: https://www.youtube.com/watch?v=quoU5fjKBqo (Min. 3:06 und 7:00)
Take-home message
Wie groß sind die Wahrscheinlichkeiten, mit 3 Würfeln eine Summe von 9 oder 10 zu erhalten?
Was ist wahrscheinlicher, in vier Würfen eines einzelnen Würfels mindestens eine ‘6’ zu würfeln (Variante A) ODER in 24 Würfen eines Würfelpaars mindestens eine ‘Doppelsechs’ zu erzielen (Variante B)?
Bei weiteren Fragen: saskia.otto(at)uni-hamburg.de
Diese Arbeit is lizenziert unter einer Creative Commons Attribution-ShareAlike 4.0 International License mit Ausnahme der entliehenen und mit Quellenangabe versehenen Abbildungen.
Kurswebseite: Data Science 2